Ⅰ. 원시 코퍼스와 주석 코퍼스
원시 코퍼스(raw corpus)
출판된 형태 그대로의 텍스트를 전자형태로 모아 놓은 것
주석 코퍼스(annotated corpus)
텍스트를 어떤 목적을 위하여 가공하고 표지를 붙여 놓은 것
주석의 목적
어떤 목적을 위하여 텍스트를 해석하고 그 해석한 결과를 표시해
말뭉치 및 음성말뭉치 그리고 문자말뭉치 등의 다양한 말뭉치를 구축하고, 이들 말뭉치에 대한 음성적 형태론적 통사론적 의미론적 분석을 통하여 컴퓨터에 언어능력을 제공하고, 또 정보전달 과정에서 정보생산자와 수신자 사이의 의사소통을 원활히 하기 위한 부호체계를 연구하는 등의 구체적인